monarchE研究是近期乳腺癌领域的热点研究。其结果表明与单独的内分泌治疗相比,加入阿贝西利(Abemaciclib)可显著改善淋巴结阳性HR+/HER2-高危早期乳腺癌患者的无浸润性疾病生存(IDFS)率和远处无复发生存(DRFS)率。间接推动2023年3月美国食品与药物管理局(FDA)对阿贝西利辅助治疗适应证的扩展。
然而,树大招风。近日,有四位学者联合撰文,公开表示monarchE研究在样本量、评价指标、研究偏倚等方面存在问题。而monarchE研究专家组面对质疑也及时给出回复。两篇文章都在5月2日于Lancet Oncology上在线发表。一时间你来我往,好不热闹!中国医学论坛报今日肿瘤公众号特为读者将双方观点整理归纳,编撰成文。同时我们还有幸邀请到我国乳腺癌治疗领域专家北京大学人民医院乳腺中心的王殊教授对双方争论焦点作点评。话不多说,就让我们跟随王殊教授,一同关注这场特别的学术碰撞吧!
monarchE研究是一项随机、开放标签的多中心Ⅲ期临床研究,共入组5637例淋巴结阳性的HR+/HER2-高危早期乳腺癌患者,患者按1∶1随机分配至阿贝西利2年联合标准辅助内分泌治疗组,或单纯标准辅助内分泌治疗组(ET组)。主要研究终点为IDFS率,次要终点包括DRFS率、总生存(OS)率、安全性等。2023年1月,monarchE研究的中期结果发表在Lancet Oncology杂志上,中位随访42月的结果表明,与单独内分泌治疗相比,联合阿贝西利治疗可显著改善入组患者的IDFS率和DRFS率,联合治疗组与ET组的4年IDFS率分别为85.8%、79.4%,绝对获益6.4%,HR为0.664 [95%置信区间(CI) 0.578~0.762, p<0.0001]。
Meirson教授等人认为monarchE研究纳入的样本量过大,是所谓的“overpowering”试验,用一个非常大的样本量去验证一个微小的临床获益,所得出的结果仅仅具有统计学差异而无实际的临床意义。此外,monarchE研究的主要终点指标是IDFS率而非OS率,而前者并非后者的有效替代指标,很可能最终并无生存获益。同时过分强调无病生存,会因药物的毒副作用降低患者生活质量,加重经济负担。此外,乳房复发的患者占monarchE研究的17%,但乳房复发患者手术治疗后对OS率影响很小。Meirson等人还提到了未能对出现复发的对照组患者提供最佳治疗会导致OS率的偏倚。
Meirson教授等人还表示,monarchE研究中有明显的患者脱落,阿贝西利用药组多于对照组,这种脱落可能是由于患者无法耐受阿贝西利所致。当两组患者脱落情况不平衡时,就会产生由信息截尾所致的偏倚,但monarchE研究并未提及,Meirson等人利用反向K-M曲线法和敏感性分析重新调整了K-M曲线,结果两组之间iDFS率差异较小,并且随着时间延长,阿贝西利组可能治疗效果更差。
Merison教授等人还对赞助药企参与研究报告撰写表示了担忧,认为商业提供的医学写作和编辑支持可能导致研究报道存在偏倚。同时药企参与试验设计,常常会为了寻求微小的效应差异而设计更大规模的试验,最终导致随机临床试验从以患者为中心的问题演变成了以商业驱动的临床试验。
最后,Merison教授等人提出monarchE研究与既往其他CDK4/6抑制剂辅助治疗研究(Penelope-B试验和PALLAS试验)结果不一致。并强调与单个试验的研究结果相比,能够被多个试验重复出的药物优势更重要。
monarchE研究人员首先对Meirson教授等人的观点表示尊重,但持有不同意见。他们表示monarchE研究人群的选择基于未被满足的临床需求,在对照组里观察到4年时有20%以上的复发率,这些结果证明了阿贝西利治疗的考量是必要的。研究根据国际共识指南选择了关键的主要和次要终点,其中包括IDFS率、DRFS率和OS率,疾病复发与OS之间的强相关性证明了使用这些终点的合理性。监管机构也接受了这些终点评估存在“生存可能会延长,使生存终点难以观察”的问题。
鉴于monarchE研究发现远处转移风险会显著降低(34%),预计随着更长时间的随访总生存也将有持续改善。OS的成熟需要更长的随访时间,等待会使很多患者错失治疗机会。大多数患者仍在积极进行长期随访评估疗效,两组之间的删失率很低且平衡,因此,Meirson教授及其同事提出的调整无浸润性病变生存或OS曲线以修正信息截尾的方法是没有根据和意义的。虽然阿贝西利使不良反应发生率增加,但是目前完整成熟的安全数据表明整体是可控可逆的,患者在治疗期间整体生活质量得到了维持。
monarchE研究4年IDFS率绝对获益率为6.4%,在monarchE研究中,为预防1例复发而需要治疗的患者数量(n=15)低于最近其他获批的辅助治疗。因此,阿贝西利获得了NCCN的1级推荐和ESMO的获益量表治愈性疗法中最高分A的肯定。
monarchE的研究结果已经改写了国内外指南,也改变了我们的临床实践,在治疗不断强化的“热”背景下,这样的一篇“冷”质疑确实也引发一些思考。
样本量设计合适吗?
质疑者认为monarchE研究是一项“overpowered”的研究,用非常大的样本量来检测微小的差异。这里引发了一个值得思考的问题,如何定义微小差异。我们知道统计学意义和临床意义并不能划等号,而有临床意义的研究终点实际上具有一定的主观性,单凭主观意愿,所有的患者都被治愈是终极目标。
我们中心曾经发表过一项国内乳腺科医生的调查问卷研究,大约一半的医生认为应该随访10年,OS率绝对获益在5%-10%是有临床意义的差异,而这样一个预期在目前的临床研究当中很难实现,我们需要更客观理性的符合目前临床实际的研究终点。ESMO临床获益分级评价体系(ESMO-MCBS)认为,OS率3年大于5%或者在OS数据尚不成熟的情况下,DFS的HR值小于0.65则评为Grade A(高水平获益)。monarchE研究研究结果显示4年IDFS率绝对获益6.4%,HR值为0.664,因此将monarchE研究的临床获益归类为微小差异有所不妥。
回顾APHINITY研究淋巴结阳性亚组,4年IDFS率3.2%,8年IDFS率绝对获益4.9%,双靶已然成为目前HER2+、淋巴结阳性乳腺癌的标准治疗,相比而言,对于预后相对较好的HR+/HER2-早期乳腺癌患者,monarchE 4年6.4%IDFS率差异带来的临床获益值得关注和认可。回顾乳腺癌内分泌治疗的相关研究,SOFT研究共入组3066例患者,TEXT研究入组2672例患者,ATAC研究共入组9366例患者,针对HER2+患者的APHINITY研究入组4804例患者,因此,认为monarchE是一项超大样本量检测微小差异的评价过于武断。
评价指标选择合理吗?
OS是最理想的评价指标,但不是唯一的指标,我们期待IDFS/DFS获益的临床研究都能有OS获益,但是,回顾既往早期乳腺癌的各项临床研究,仅开展较早的一些研究取得了OS阳性结果,比如HERA研究、CREATE-X研究等,随着临床研究对照组的标准治疗不断强化,试验组OS获益变得更难。IDFS是STEEP V2.0推荐的标准临床研究终点,也是近年来早期乳腺癌临床研究最常选择的主要研究终点,包括APHINITY研究、KATHERINE研究等,IDFS获益结果已改变临床实践,但至今尚未报道OS获益。疾病复发与总生存之间仍然有强相关性,对于HR+/HER2-的患者,我们需要更长时间随访才能看到OS结果,一味强调OS获益而忽略降低复发转移风险带给患者的获益可能会错失治疗时机。
两组数据偏倚大吗?
质疑者认为试验组删失事件过多,1年时的删失人数172对145,2年时228对215。信息审查时分析的是除去删失数据之后的患者,并不能代表随机化的患者,会导致数据偏倚。这是评判临床研究值得思考的问题,过多的删失数据会影响最终的生存分析数据,但是,患者脱落在临床研究中是相对常见的问题,尤其是治疗组增加不良反应的情况下势必会影响患者的粘附性,如APHINITY研究试验组与对照组完成1年治疗的患者分别为84.5%、87.4%。但是,所有的临床研究设计之初都会考虑删失数据,就本研究而言,删失率低,且两组基本平衡,质疑者将删失数据作为事件数重新调整K-M曲线的分析方法并不能推翻原始数据分析得出的结果。
还应该关注些什么?
当然,monarchE研究目前仅报道了所有入组患者的数据结果,cohort2的患者是否获益尚不可知,这是该临床研究值得进一步去关注的话题,NATALEE研究入组了一部分中危患者,或许可以提供相应的证据支持。此外,对于HR+/HER2+的患者,我们是否应该应用阿贝西利也缺乏证据,尤其是对于极高危的患者,是否可以从双通路抑制中获益,值得我们进一步探索。最后,对于BRCA基因突变的患者,如何选择强化治疗也值得我们进一步思考。
阿贝西利为早期HR+/HER2-高危患者提供了有效的强化治疗,尽管,类似的研究如PALLAS等未能取得阳性结果,但并不影响monarchE研究对临床实践的指导,我们也期待NATALEE研究为早期HR+/HER2-高危患者的CDK4/6抑制剂强化治疗再添新证。
王殊 教授
-
医学博士,主任医师,教授,博士生导师
-
北京大学人民医院乳腺中心主任
-
中国临床肿瘤学会乳腺癌专业委员会常委
-
中国抗癌协会乳腺癌专业委员会常委
-
中华医学会外科学分会乳腺学组委员
-
北京医学会乳腺疾病分会副主任委员
审阅 | 北京大学人民医院 王殊 王朝斌
编辑 | 中国医学论坛报 胡岳